1
Le spectre de l'adaptation des modèles
AI030Lesson 5
00:00

Imaginez un modèle de langage à grande échelle (LLM) comme un brillant mais spécialiste généraliste. Pour transformer ce généraliste en professionnel spécialisé — par exemple un radiologue clinique ou un avocat contractuel — nous naviguons entre spectre d'adaptation des modèles. Ce spectre définit la manière dont nous passons du prompting zéro-tiret au traitement profond des réseaux neuronaux, en équilibrant les contraintes matérielles face à la demande de résultats d'avant-garde (SOTA) de haute performance.

Le continuum d'adaptationContrôle et stabilité (en augmentation →)Apprentissage in-contextPEFT / LoRAFine-tuning complet

Modes clés d'adaptation

  • Apprentissage in-context (ICL): Le modèle reste « gelé ». Il apprend à estimer $P(y|x)$ en observant des exemples directement dans le prompt lui-même. Bien qu'rapide, il souffre souvent d'une forte variance et de hallucinations.
  • Alignement et stabilité: Pour atteindre une fiabilité de niveau production, nous devons avancer vers la droite du spectre. Le fine-tuning offre un meilleur alignement avec le jugement humain en pénalisant explicitement les écarts par rapport aux schémas de vérité terrain.
  • L'objectif SOTA: Atteindre des performances de haut niveau exige de naviguer entre compromis. Le fine-tuning complet offre un contrôle maximal mais comporte le risque de « oubli catastrophique », tandis que PEFT (fine-tuning efficace en paramètres) offre un compromis favorable au matériel.
Exemple du monde réel
Considérez un assistant médical. En utilisant ICL, vous fournissez trois exemples symptôme-diagnostic dans le prompt. En utilisant le fine-tuning, vous entraînez le modèle sur 50 000 dossiers médicaux. Ce dernier produit un modèle qui comprend naturellement le jargon clinique et affiche une stabilité et une cohérence bien supérieures cohérence et stabilité.